InftyThink+: Razonamiento eficiente en horizonte infinito con RL Optimiza el razonamiento infinito-horizonte con InftyThink+ usando RL. Mejora precisión y eficiencia, superando limitaciones del chain-of-thought. 2026-06-03 · 1 min